Introdução


O presente trabalho foi elaborado tendo como propósito analisar os dados de uma das maiores bases pesquisáveis sobre filmes, séries e celebridades do mundo e transformar estes dados em informações. Trata-se da base Imdb (Internet Move Database), criada em 1990 por Col Needham, no Reino Unido, e comprada pela Amazon em 1998.

Aos apaixonados pela sétima arte, que não abrem mão do prazer em assistir a um filme, no aconchego de casa ou em uma sessão de cinema, trarei algumas curiosidades da indústria cinematográfica, em especial, de um filme que impressionou o público em 2010 com a qualidade dos efeitos visuais, e que deve retornar às telas dos cinemas para a continuação da saga com o episódio “The Way of Water” (capítulo 2) de Avatar, um dos maiores sucessos de bilheteria da história, dirigido por James Cameron.

De acordo com o site “Avatar wiki”, I see you é uma saudação. Na língua Na’vi é expresso por Oel ngati kame para uma saudação neutra ou Oel ngati kameie para expressar um sentimento positivo sobre conhecer alguém. Também é o tema principal do filme, interpretado por Leona Lewis e produzido por James Horner e Simon Franglen.

Caso desejem ver os códigos que geraram as visualizações deste trabalho, eles estarão disponíveis ao lado das tabelas e gráficos por meio dos botões CODE.


Análises


As informações foram obtidas a partir das bases “Imdb”, que contém os dados gerais dos filmes e séries, “Imdb_pessoas”, com os dados sobre os elencos, diretores e roteiristas e “Imdb_avaliacoes”, com as notas médias e os dados de classificações.

A base “Imdb” possui 85855 linhas com 21 variáveis de filmes produzidos entre 1894 e 2020. A “imdb_pessoas” por sua vez conta com 297705 linhas e 15 colunas e a “imdb_avaliacoes” com um total de 85855 linhas e 19 colunas.

Na seção de anexos, ao final deste relatório, disponibilizo os dicionários das bases com as listas de variáveis e definições.

As operações de importação, arrumação, transformação e visualização dos dados foram realizadas por meio da linguagem R, seus pacotes e extensões.


1. Evolução da produção da indústria cinematográfica


Em 28 de setembro de 1895, os irmãos Lumière realizaram a primeira exibição pública do cinematógrafo, uma invenção que imprimia uma sucessão de fotos em um filme de celulose e que por meio de uma manivela reproduzia as imagens em sequência, transformando as figuras estáticas em imagens dinâmicas projetadas sobre uma tela. Desde então, milhares de filmes foram produzidos, alcançando o auge em 2018.

Pode-se observar no gráfico 01 que a quantidade de filmes produzidos evoluiu de 1 obra em 1894 para 271 obras em 1946, pós Segunda Guerra Mundial, e então para 3281 lançamentos em 2018. Entretanto, com o isolamento do público devido à pandemia de COVID 19, a indústria cinematográfica adiou os lançamentos de seus filmes, provocando a redução do número de produções nos anos seguintes.



# Gráfico "Evolução da Indústria Cinematográfica"

p01 <- imdb_novo |> 
  mutate(ano_lancamento = year(data_lancamento)) |>                     # cria a coluna com ano de lançamento.
  select(ano_lancamento) |> 
  drop_na() |>
  group_by(ano_lancamento) |> 
  summarise(qte = n()) |>                                                 
  slice_head(n=112) |>                    # exclui os dados de 2021, pois possui dados de apenas alguns meses.
  ggplot()+
  aes(x = ano_lancamento, 
      y = qte)+
  annotate("rect",                  # cria um destaque em azul para os anos de maior produção cinematográfica.
           xmin = 2010,
           xmax = 2026,
           ymin = 2950, 
           ymax = 3500,
           fill = "#99D8FF", 
           alpha = 0.3
           ) +
  annotate("text",                                     # cria anotação de texto para a área destacada em azul.
           x = 1990, 
           y = 3281,
           label = "Auge da produção cinematográfica", 
           size = 3
           ) +
  geom_line(color = "#4C586B")+            # gráfico lollypop formado pela combinação dos geom's line e point.
  geom_point(color = "#A71D31",                                                           
             shape = 7,
             size = 0.7
             )+
  gghighlight(ano_lancamento >=1946,                  # destaca no gráfico os dados dos anos a partir de 1960.
              unhighlighted_params = list(colour = "#4C586B")
              )+
  labs(title = "Total de filmes por ano",                           
       x = "
    Ano",
       y = "Quantidade 
    
    "            
  )+
  scale_x_continuous(breaks = seq(0,                                    
                                  2022, 
                                  10
                                  )
                     ) +
  scale_y_continuous(breaks = seq(0,                                  
                                  4000, 
                                  500
                                  ),
                     labels = number_format(accuracy = 0.1,
                                            big.mark = ".",
                                            decimal.mark = ",",
                                            )
                     ) +
  theme_classic()   

# Gráfico - evolução da indústria cinematográfica
  
p01 |> 
  ggplotly()   

Gráfico 01 - Evolução da Industria Cinematográfica. Fonte: Base de dados Imdb



2. A maior quantidade de filmes produzidos em um mês individualizados por ano


O ano de 2018 teve o maior número de estreias da história e em outubro deste ano (2018) o maior número de estreias em um mês com 386 obras cinematográficas, superando o número de lançamentos registrados até então de setembro de 2017.

#Tabela 01: Maior quantidade de filmes em um mês

# criar a coluna mes

imdb_datas <- imdb_novo |>
  mutate(mes = month(data_lancamento,  
                     label = TRUE, 
                     abbr = TRUE
                     )
         )

# encontrar o mês histórico com o maior número de lançamentos.

mes_maior_lancamento <- imdb_datas |>   
  group_by(mes,
           ano
           ) |>  
  summarise(qte = n()) |>             
  drop_na() |> 
  slice_max(qte) |> 
  arrange(desc(qte))

# define condicção para formatar o valor de qte para a tabela 01

mes_maior_lancamento_tab01 <- mes_maior_lancamento

mes_maior_lancamento_tab01[[3]] <-  cell_spec(mes_maior_lancamento_tab01[[3]],    # destacar a qte  na tabela.
                                              color = ifelse(mes_maior_lancamento_tab01[[3]] >= 380,
                                                             "#B80C09",
                                                             "#3F88C5"
                                                             )
                                              )

### selecionar apena a primeira linha

mes_maior_lancamento_tab01 <- mes_maior_lancamento_tab01 |>   
  head(n=1)

### Tabela 01 - maior quantidade de filmes em um mês

tab01 <-  mes_maior_lancamento_tab01 |> 
  kbl(align = "l", 
      col.names = c("Mês",  
                    "Ano de Lançamento", 
                    "Quantidade de Filmes"
                    ),
      full_width = TRUE,
      escape = FALSE
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # formatar estilo da tabela.
                                      "condensed"
                                      ),
                font_size = 12,
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE, 
                                   background = "#EDF6FD"
                                   ) 
                ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                                  # configurações das colunas.
              width = "10cm"
              ) |>      
  column_spec(2, 
              width = "10cm"
              ) |>
  column_spec(3,
              width = "10cm"
              ) |> 
  footnote(general = "Maior quantidade de filmes em um mês por ano. Fonte: Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 01:"
           )

# visualiza a tabela 01

tab01     
Mês Ano de Lançamento Quantidade de Filmes
out 2018 386
Tabela 01: Maior quantidade de filmes em um mês por ano. Fonte: Base de dados IMDB.


No gráfico 02, tem-se os 13 meses com os maiores números de filmes, todos entre os anos de 2014 e 2018, período de maior produção cinematográfica (vide gráfico 01).

# Gráfico 02 - meses com maiores totais de lançamentos

# encontrar os 13 meses com maiores totais de lançamentos

meses_mais_qte <- mes_maior_lancamento |> 
  group_by(qte, ano) |>
  summarise(mes) |> 
  arrange(desc(qte)) |> 
  unite(col = "mes_ano",
        c("mes",
          "ano"
          ),
        sep = "/"
        ) |>       
  arrange(desc(qte)) |> 
  head(13) 

# paleta de cores que será usada nos gráficos 

cores_plot02 <- c("#CC5A71", "#536265", "#536265", "#536265", "#536265","#536265",
                  "#536265", "#536265", "#536265", "#536265", "#536265","#536265",
                  "#536265")

# gráfico meses com maiores totais de lançamentos.

plot02 <- meses_mais_qte|> 
  ggplot(aes(x = fct_reorder(mes_ano, 
                             qte,
                             .desc = TRUE    
                             ), 
             y = qte, 
             fill = mes_ano,
             label = qte
             )
         )+                                        # gráfico lollypop - a partir de geom_point e geom_segment.
  geom_point(size = 5,                                                             # cria o elemento circular.
             color = cores_plot02
             )+
  geom_label(size = 5, 
             alpha = 0, 
             label.size = NA, 
             color = cores_plot02,   
             vjust = -1
             ) +
  geom_segment(aes(x = mes_ano,                                                    # cria o elemento segmento.
                   xend = mes_ano,
                   y = 0,
                   yend = qte
                   ),
               color = cores_plot02,
               size = 1.5,  
               )+
  labs(title = "Total de lançamentos por *<span style = 'color:#CC5A71;'>mês </span>*",
       subtitle ="Os meses com maior quantidade de estreias",        
       y = "Quantidade de filmes
    ",
       x = "
    Meses do ano"
  ) +
  theme_classic()+                                                               # seleção do tema do gráfico.
  scale_y_continuous(breaks = seq(0,
                                  500,
                                  50
                                  ),
                     limits = c(0, 
                                500
                                ),
                     expand = expansion(add = c(0,
                                                0)
                                        )
                     )+                                   
  theme_imdb()

# Visualiza o gráfico meses com maiores totais de lançamentos

plot02     
Gráfico 02 - Meses com os maiores números de lançamentos por ano. Fonte: Base de dados Imdb

Gráfico 02 - Meses com os maiores números de lançamentos por ano. Fonte: Base de dados Imdb



Na tabela 02, listo os 5 filmes deste mês de outubro com as maiores notas médias, considerando apenas os filmes com mais de 100000 avaliações.


# Tabela 02: Top 5 filmes

# obtenção da relação dos 5 filmes  de outubro de 2018 por ranking 

mes_maior_lancamento <- imdb_datas |>                                
  group_by(mes) |>        
  summarise(qte = n(),
            titulo,
            data_lancamento, 
            nota_imdb, 
            num_avaliacoes,
            pais,
            ano = year(data_lancamento)) |>
  filter(mes == "out" & ano == 2018 & num_avaliacoes >= 100000) |> # filtros 2018 e mais de 100000 avaliacões.
  arrange(desc(nota_imdb)) |> 
  slice_head(n=5)

mes_maior_lancamento$mes <- NULL                                                        # Exclusão de colunas. 
mes_maior_lancamento$qte <- NULL

# formatar a variável data_lancamento para a tabela 02

mes_maior_lancamento <- mes_maior_lancamento |> 
  mutate(data_lancamento = format(data_lancamento, "%d-%m-%Y"))

# Tabela com os 5 filmes  de outubro de 2018com melhores rankings

tab02 <- mes_maior_lancamento |> 
  select(titulo, data_lancamento, nota_imdb, num_avaliacoes, pais) |> 
kbl(
  align = "l",                                                            # alinhamento do texto do cabeçalho.
  col.names = c("título",                                                       # define o nome das variáveis.
                "lançamento", 
                "nota",
                "avaliações",
                "país"),
  ) |> 
  kable_styling(                                                          # altera as configurações da tabela.
    bootstrap_options = c("striped", "condensed"),
    html_font = "",
    font_size = 12,
    full_width = TRUE, 
    fixed_thead = list(enabled = TRUE, background = "#EDF6FD"),
    ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                        # altera as configurações das colunas.
              bold = FALSE,
              width = "10cm",
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "4cm"
              ) |>
  column_spec(3,
              bold = FALSE,
              width = "2cm"
              ) |> 
  column_spec(4,
              bold = FALSE,
              width = "4cm"
              ) |> 
  column_spec(5,
              bold = FALSE,
              width = "10cm"
              ) |> 
  footnote(general = "Top 5 filmes Nota Média/ Outubro 2018. Fonte: Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 02:",
           )

# visualiza a tabela - top 5 filmes

tab02
título lançamento nota avaliações país
A Star Is Born 11-10-2018 7.7 318520 USA
Searching 18-10-2018 7.6 132937 Russia, USA
First Man - Il primo uomo 31-10-2018 7.3 159476 USA, Japan
Soldado 18-10-2018 7.1 119798 USA, Mexico
7 sconosciuti a El Royale 25-10-2018 7.1 123415 USA
Tabela 02: Top 5 filmes Nota Média/ Outubro 2018. Fonte: Base de dados IMDB.


Abaixo, apresento um resumo de cada um dos 5 filmes, a partir dos dados da base Imdb, com uma breve sinopse.


A Star is Born
imdb_nasce_uma_estrela <- imdb_filmes_dolares |> 
  filter(titulo == "A Star Is Born") |> 
  mutate(thumbnail_nasce_uma_estrela = "../data-raw/nasce_uma_estrela_thumbnail.jpg") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro, thumbnail_nasce_uma_estrela)

O filme “A Star Is Born” foi lançado no Brasil como “Nasce uma Estrela”. Pertence aos gêneros Drama, Music, Romance. Sua premiere ocorreu em 11-10-2018, com duração de 136 minutos sob a direção de Bradley Cooper. Roteiro de Eric Roth, Bradley Cooper.

Contou com a participação de Lady Gaga, Bradley Cooper, Sam Elliott, Andrew Dice Clay, Rafi Gavron, Anthony Ramos, Dave Chappelle, Alec Baldwin, Marlon Williams, Brandi Carlile, Ron Rifkin, Barry Shabaka Henley, Michael D. Roberts, Michael Harney, Rebecca Field em seu elenco.

A obra teve um orçamento, de acordo com a base, de US36 milhões e uma receita de US436.19 milhões, obtendo um lucro de US$400.19 milhões.

Sinopse: Um experiente músico descobre a jovem artista desconhecida a quem ajuda a encontrar fama, mas acaba se apaixonando por ela. O relacionamento pessoal entre os dois começa a desandar à medida que Jack luta contra problemas com alcoolismo.
Fonte: imdb-Nasce uma estrela


Searching
imdb_searching <- imdb_filmes_dolares |> 
  filter(titulo == "Searching") |> 
  mutate(thumbnail_searching = "../data-raw/Buscando_thumbnail.jpg") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro, thumbnail_searching)

O filme “Searching” foi lançado no Brasil como “Buscando”. Pertence aos gêneros Drama, Mystery, Thriller. Sua premiere ocorreu em 18-10-2018, com duração de 102 minutos sob a direção de Aneesh Chaganty. Roteiro de Aneesh Chaganty, Sev Ohanian.

Contou com a participação de John Cho, Sara Sohn, Alex Jayne Go, Megan Liu, Kya Dawn Lau, Michelle La, Joseph Lee, Dominic Hoffman, Sylvia Minassian, Melissa Disney, Connor McRaith, Colin Woodell, Debra Messing, Joseph John Schirle, Ashley Edner em seu elenco.

A obra teve um orçamento, de acordo com a base, de US0.88 milhões e uma receita de US75.46 milhões, obtendo um lucro de US$74.58 milhões.

Sinopse: Depois que sua filha de 16 anos desaparece, um pai desesperado entra em seu laptop procurando pistas para encontrá-la.
Fonte: imdb-buscando

First Man
imdb_firstman <- imdb_filmes_dolares |> 
  filter(titulo == "First Man - Il primo uomo") |> 
  mutate(thumbnail_firstman = "../data-raw/first_man_thumbnail.jpg") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro, thumbnail_firstman)

O filme “First Man - Il primo uomo” foi lançado no Brasil como “O Primeiro Homem”. Pertence aos gêneros Biography, Drama, History. Sua premiere ocorreu em 31-10-2018, com duração de 141 minutos sob a direção de Damien Chazelle. Roteiro de Josh Singer, James R. Hansen.

Contou com a participação de Ryan Gosling, Claire Foy, Jason Clarke, Kyle Chandler, Corey Stoll, Patrick Fugit, Christopher Abbott, Ciarán Hinds, Olivia Hamilton, Pablo Schreiber, Shea Whigham, Lukas Haas, Ethan Embry, Brian d’Arcy James, Cory Michael Smith em seu elenco.

A obra teve um orçamento, de acordo com a base, de US59 milhões e uma receita de US105.7 milhões, obtendo um lucro de US$46.7 milhões.

Sinopse: Um olhar sobre a vida do astronauta Neil Armstrong e a lendária missão espacial que o levou a ser o primeiro homem a caminhar na Lua. Fonte: imdb-first man

Soldado
imdb_soldado <- imdb_filmes_dolares |> 
  filter(titulo == "Soldado") |> 
  mutate(thumbnail_soldado = "../data-raw/sicario_thumbnail.jpg") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro, thumbnail_soldado)

O filme “Soldado” foi lançado no Brasil como “Sicario 2 - Soldado”. Pertence aos gêneros Action, Adventure, Crime. Sua premiere ocorreu em 18-10-2018, com duração de 122 minutos sob a direção de Stefano Sollima. Roteiro de Taylor Sheridan.

Contou com a participação de Benicio Del Toro, Josh Brolin, Isabela Merced, Jeffrey Donovan, Catherine Keener, Manuel Garcia-Rulfo, Matthew Modine, Shea Whigham, Elijah Rodriguez, Howard Ferguson Jr., David Castañeda, Jacqueline Torres, Raoul Max Trujillo, Bruno Bichir, Jake Picking em seu elenco.

A obra teve um orçamento, de acordo com a base, de US35 milhões e uma receita de US75.84 milhões, obtendo um lucro de US$40.84 milhões.

Sinopse: A guerra contra as drogas na fronteira do México com os Estados Unidos aumenta quando os cartéis começam a introduzir terroristas no território americano. Fonte: imdb-soldado

7 sconosciuti a El Royale
imdb_royale <- imdb_filmes_dolares |> 
  filter(titulo == "7 sconosciuti a El Royale") |> 
  mutate(thumbnail_royale = "../data-raw/maus_momentos_em_royale_thumbnail.jpg") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro, thumbnail_royale)

O filme “7 sconosciuti a El Royale” foi lançado no Brasil como “Maus Momentos no Hotel Royale”. Pertence aos gêneros Crime, Drama, Mystery. Sua premiere ocorreu em 25-10-2018, com duração de 141 minutos sob a direção de Drew Goddard. Roteiro de Drew Goddard.

Contou com a participação de Jeff Bridges, Cynthia Erivo, Dakota Johnson, Jon Hamm, Chris Hemsworth, Cailee Spaeny, Lewis Pullman, Nick Offerman, Xavier Dolan, Shea Whigham, Mark O’Brien, Charles Halford, Jim O’Heir, Gerry Nairn, Alvina August em seu elenco.

A obra teve um orçamento, de acordo com a base, de US32 milhões e uma receita de US31.88 milhões, obtendo um prejuízo de US$-0.12 milhões.

Sinopse: Em 1969 alguns estranhos com segredos se conhecem por casualidade no hotel El Royale no lago Tahoe. Durante uma das noites, cada um mostrará sua verdadeir personalidade. Fonte: imdb-hotel royale


3. O mês com o maior número de filmes no geral


Outubro foi o mês, entre todos os meses, com o maior número de estreias, considerando todos os anos. Foram mais de 8000 títulos, valor até então nunca atingido como pode ser visto na tabela 03.


# tabela 03 - Mês com o maior número de lançamentos

# encontrar os meses com os maiores números de lançamentos (geral)

mes_maior_lancamento_geral <- imdb_datas |>                        
  group_by(mes) |>        
  summarise(qte = n()) |>             
  drop_na() |>
  arrange(desc(qte))


# tabela 03 - mes com maior lançamento geral

# configura qte do mes com mais lançamento para tabela 03

mes_maior_lancamento_tab03 <- mes_maior_lancamento_geral

mes_maior_lancamento_tab03[[2]] <- cell_spec(mes_maior_lancamento_tab03[[2]],
                                             color = ifelse(mes_maior_lancamento_tab03[[2]] >=8000,
                                                            "#B80C09",
                                                             "#3F88C5"
                                                            )
                                             )

# Tabela 03 - Mês com maior número de lançamentos

tab03 <- mes_maior_lancamento_tab03 |> 
  kbl(align = "l",                                                                   # alinhamento dos textos.
      col.names = c("Mês",                                                        
                    "Quantidade de Filmes"
                    ),
      full_width = TRUE,
      escape = FALSE
      ) |> 
  kable_styling(bootstrap_options = c("striped",
                                      "condensed"
                                      ),
                font_size = 12,
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE, 
                                   background = "#EDF6FD"
                                   ) 
                ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                                  # configurações das colunas.
              bold = FALSE,
              width = "10cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "10cm"
              ) |>
  footnote(general = "Maior quantidade de filmes no geral. Fonte: Base de dados IMDB.",            
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 03:"
           )

# visualiza a tabela 03

tab03    
Mês Quantidade de Filmes
out 8734
set 7924
mar 7435
nov 7094
abr 7078
dez 6618
fev 6441
ago 6399
jan 6361
mai 6173
jun 5800
jul 5235
Tabela 03: Maior quantidade de filmes no geral. Fonte: Base de dados IMDB.


4. O dia


As produções cinematográficas estreiam todas as semanas no mundo inteiro. No Brasil, elas ocorrem nas quintas-feiras.

Analisando os dias de lançamentos dos filmes da base Imdb, observa-se, no gráfico 03, que o total de estreias ocorridas no primeiro dia de cada mês, com um total de 7260 filmes, foi significativamente maior que o ocorrido nos demais dias, cujas quantidades pouco variaram (entre 2240 e 2831 filmes). O dia 31 foi, naturalmente, aquele com menor número de estreias, pois nem todos os meses possuem este dia.


# Tabela 04 - Dia com o maior número de lancamentos

# Obter o dia com o maior número de lançamentos

dia_maior_lancamento <- imdb_novo |> 
  mutate(dia = day(data_lancamento)) |> 
  group_by(dia) |> 
  summarise(qtde = n()) |> 
  drop_na() |> 
  slice_max(order_by = qtde)                         # obtem o maior valor ordenado pela quantidade de filmes.

### configurar valor qtde lançamentos para a tabela 04

dia_maior_lancamento[[2]][1] <- cell_spec(dia_maior_lancamento[[2]][1], 
                                          color = ifelse(dia_maior_lancamento[[2]][1]==7260,
                                                         "#B80C09",
                                                         ""
                                                         )
                                          )

### Tabela 04 - dia com o maior número de lançamentos

tab04 <- dia_maior_lancamento |>                                                                
  kbl(align = "l",                                                      
      col.names = c("Dia",                                                
                    "Quantidade de Filmes"
                    ),
      escape = FALSE
      ) |> 
  kable_styling(bootstrap_options = c("striped",                               # configura o estilo da tabela.
                                      "condensed"
                                      ),
                font_size = 12,
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |>                                                              # define o tema da tabela.
  column_spec(1,                                                        
              bold = FALSE,
              width = "15cm"
              ) |>      
  column_spec(2,
              bold = FALSE,
              width = "15cm"
              ) |> 
  footnote(general = "Dia com maior número de lançamentos. fonte: Base de dados IMDB.",       
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 04:"
           )

### Visualiza tabela dia com o maior número de filmes lançados

tab04
Dia Quantidade de Filmes
1 7260
Tabela 04: Dia com maior número de lançamentos. fonte: Base de dados IMDB.


# Grafico total de lançamentos por dia

plot03<- imdb_novo |> 
  mutate(dia = day(data_lancamento)) |> 
  group_by(dia) |> 
  summarise(qtde = n()) |> 
  drop_na() |> 
  ggplot()+                           
  aes(x = dia, 
      y = qtde, 
      fill = dia, 
      label = qtde)+
  geom_point( size = 5,                                                              # cria elemento circular.
              color = "#CC5A71" 
              )+
  geom_label(size = 3.5, 
             alpha = 0,  
             label.size = NA, 
             color = "#CC5A71",     
             vjust = -1,       
             ) +
  geom_segment(aes(x = dia,                                                         # criar elemento segmento.
                   xend = dia,
                   y = 0,
                   yend = qtde
                   ),
               size = 1.5, 
               color = "#CC5A71"  
               )+
  gghighlight(dia == 1 | dia == 31,                                                  # destaca os dias 1 e 31. 
              unhighlighted_params = list(colour = "#4C586B"
                                          ) 
              )+
  labs(title = "Total de lançamentos por *<span style = 'color:#CC5A71;'>dia </span>*",
    subtitle ="Os dias com maior e menor quantidade de estreias", 
    y = "Quantidade de filmes
    ",
    x = "
    Dias do mês"
  ) +
  theme_classic()+                          
  scale_y_continuous(breaks = seq(0,
                                  8000,
                                  1000
                                  ),                                              # formatar escala do eixo y. 
                     limits = c(0,
                                8000
                                ),
                     expand = c(0,
                                0
                                )
                     ) +                                        
  scale_x_continuous(breaks = seq(0, 
                                  31,
                                  1
                                  )
                     ) +                                                          # formatar escala do eixo x.
  theme_imdb()

# Visualiza o gráfico total de lançamentos por dia

plot03                  
Gráfico 03 - Total de lançamentos por dia. Fonte: Base de dados Imdb

Gráfico 03 - Total de lançamentos por dia. Fonte: Base de dados Imdb


5. Os países com maior número de filmes


Embora a indústria cinematográfica indiana seja a que mais produza obras atualmente, ela ocupa apenas a quarta posição em quantidades de filmes da base Imdb. Os Estados Unidos são notadamente o país com o maior número de filmes, como mostrado na tabela 05.


# Tabela 05 - paises maiores produtores de filmes

# Obter os 5 países com mais filmes na base

top_5_paises <- imdb_novo |> 
  separate_rows(pais, sep = ", ") |> 
  group_by(pais) |> 
  summarise(qtde = n()) |> 
  arrange(desc(qtde)) |> 
  slice_head(n=5)

# Tabela 05 paises maiores produtores de filmes

tab05 <- top_5_paises |>                                                                        
  kbl(align = "l",                                      
      col.names = c("País",                   
                  "Quantidade de Filmes"
                  ),
      ) |> 
  kable_styling(  bootstrap_options = c("striped",                                # define o estilo da tabela.
                                        "condensed"
                                        ),
                  font_size = 12,
                  full_width = TRUE, 
                  fixed_thead = list(enabled = TRUE, 
                                     background = "#EDF6FD"
                                     )
                  ) |> 
  kable_classic_2() |>                                                              # define o tema da tabela.
  column_spec(1,                                                
              bold = FALSE,
              width = "15cm"
              ) |>      
  column_spec(2,                        
              bold = FALSE,
              width = "15cm"  
              ) |> 
  footnote(general = "Países maiores produtores de filmes. Fonte: Base de dados IMDB.",
           footnote_as_chunk = TRUE,                  
           fixed_small_size = TRUE,
           general_title = "Tabela 05:"
           )

# Visualiza a tabela - paises maiores produtores de filmes

tab05
País Quantidade de Filmes
USA 34325
France 8311
UK 7490
India 6373
Italy 5056
Tabela 05: Países maiores produtores de filmes. Fonte: Base de dados IMDB.


6. O Brasil na base Imdb


O gráfico 04 mostra o Brasil na vigésima segunda posição, com 979 filmes produzidos entre 1931 e 2020, entre os quais “Cidade de Deus” e “O Auto da Compadecida” possuem ambos a maior média de 8.6, conforme a tabela 06.

# gráfico 04: paises e totais de lançamentos

# obter os 22 países com maiores quantidades de filmes lançados

top_22_paises <- imdb_novo |> 
  separate_rows(pais, sep = ", ") |> 
  group_by(pais) |> 
  summarise(qtde = n()) |> 
  arrange(desc(qtde)) |> 
  slice_head(n=22) 
  
# Paleta de cores para os elementos gráficos

cor <- c(                                               
  "#c42847", "#ffad05", "#7d5ba6", "#00bbf9", "#2bc016",
  "#536265", "#536265", "#536265", "#536265", "#536265",
  "#536265", "#536265", "#536265", "#536265", "#536265",
  "#536265", "#536265", "#536265", "#536265", "#536265",
  "#536265", "#DE541E"
)

### Gráfico 04 - com os 16 países com maior número de filmes produzidos ----

plot04 <- top_22_paises |> 
  ggplot(aes(y = fct_reorder(pais,      # reordenar a sequência dos países em ordem decrescente da quantidade.
                             qtde, 
                             .desc = FALSE
                             ),
             x = qtde, 
             label = qtde
             )
         ) +
  geom_col(fill = cor)+
  geom_label(size = 4.5, 
             alpha = 0,
             label.size = NA,    
             fontface = "bold",  
             color = cor,
             hjust = -0.3
             ) +
  geom_curve(aes(y = 18,                                                       # formatar curva para anotação.
                 x = 8000,  
                 xend = 16000,     
                 yend = 16
                 ),
             arrow = arrow(type = "closed",                                         # formata a seta da linha.
                           length = unit(0.02,
                                         "npc"
                                         )
                           ),
             curvature = 0,  
             color = "#000000" 
             ) +
  geom_curve(aes(y = 1,                                                        # formatar curva para anotação.
                 x = 2800,  
                 xend = 11000,     
                 yend = 2
                 ),
             arrow = arrow(type = "closed",                                         # formata a seta da linha.
                           length = unit(0.02,
                                         "npc"
                                         ) 
                           ),
             curvature = 0, 
             color = "#000000"
             )+
  labs(title = "Países com maior número de filmes e o Brasil",
       subtitle = "Destaque para os cinco paises com maiores notas",
       x = "Quantidade de filmes lançados",
       y = "Paises"
       )+
  scale_x_continuous(breaks = seq(0,
                                  35500,
                                  2500
                                  ),
                     limits = c(0,
                                35500
                                ),
                     expand = expansion(add = c(0,
                                                1500
                                                )
                                        ),
                     labels = scales::number_format(accuracy = 1,
                                                    big.mark = "."
                                                    )
                     )+
  scale_y_discrete(expand = expansion(add = c(1,
                                              0
                                              )
                                      )
                   )+
  theme_classic()+                                                                 # define o tema do gráfico.
  theme_imdb()+
  annotate("text",
            x = 22000,
            y = 15.5,
            label = "Relação dos cinco países com mais lançamentos 
            registrados na base IMDB",
            color = "#000000", 
            size = 4,
            family = ""
           )+
  annotate( "text",
            x = 14700, 
            y = 2, 
            label = "Vigésima segunda posição",
            color = "#000000", 
            size = 4,
            family = ""
            )

# visualiza o gráfico 04 - paise e quantidades de filmes

plot04
Gráfico 04 - Países com mais filmes lançados e o Brasil. Fonte: Base de dados Imdb

Gráfico 04 - Países com mais filmes lançados e o Brasil. Fonte: Base de dados Imdb


# Tabela dos filmes brasileiros com maior ranking

tab06 <- top_5_filmes_brasil |>  
  kbl(align = "l",   
      col.names = c("Título",  
                    "Ano",
                    "Gênero",
                    "Nota IMDB",
                    "Numero de Avaliações"
                    ),
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # altera o estilo da tabela.
                                      "condensed"
                                      ),
                font_size = 12,   
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                          # altera as configurações da tabela.
              bold = FALSE,
              # background = "#022859", 
              # color = "#FFFFFF",
              width = "14cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              # background = "#022859",
              # color = "#FFFFFF",
              width = "3cm"
              ) |> 
  column_spec(3,                                                          # altera as configurações da tabela.
              bold = FALSE,
              # background = "#022859", 
              # color = "#FFFFFF",
              width = "7cm"
              ) |>
  column_spec(4,                                                          # altera as configurações da tabela.
              bold = FALSE,
              # background = "#022859", 
              # color = "#FFFFFF",
              width = "5cm"
              ) |>
  column_spec(5,                                                          # altera as configurações da tabela.
              bold = FALSE,
              # background = "#022859", 
              # color = "#FFFFFF",
              width = "5cm"
              ) |>
    footnote(general = "Filmes nacionais com a melhores notas Imdb. Fonte: Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 06:",
           )

# Visualiza a tabela - filmes nacionais com maiores notas medias

tab06
Título Ano Gênero Nota IMDB Numero de Avaliações
City of God 2002 Crime, Drama 8.6 685856
O Auto da Compadecida 2000 Comedy, Drama, Western 8.6 11127
O Pagador de Promessas 1962 Drama 8.3 2691
Divaldo: O Mensageiro da Paz 2019 Biography, Drama 8.3 233
Tropa de elite - Gli squadroni della morte 2007 Action, Crime, Drama 8.1 96460
Tabela 06: Filmes nacionais com a melhores notas Imdb. Fonte: Base de dados IMDB.


7. Lista de todas as moedas citadas na base


A variável orçamento representa o valor total estimado de gastos para a produção e divulgação de um filme ou série. A indústria movimenta bilhões de dólares utilizados na contratação de tecnologias para produção de efeitos especiais e trilhas sonoras e na contratação de seu elenco.

A base Imdb possui os valores de orçamento em variadas moedas. Relacionei todas as moedas presentes no dataset e listei-as na tabela 07 por código e divisa.


# Tabela 07 - relação de moedas da base

# lista de todas as moedas da base - coluna orçamento

moedas_orcamento <- imdb_novo |> 
  select(orcamento) |>
  mutate(moeda = str_extract(string = orcamento,                    # cria a coluna com os símbolos de moedas.
                             pattern = "[\\w | \\$].* " )        # regex para extração dos símbolos de moedas.
         ) |> 
  distinct(moeda) |>                      
  drop_na() |> 
  arrange(moeda)

# substituir o símbolo de moeda de $ para USD.

moedas_orcamento <- moedas_orcamento |> 
  mutate(moeda = str_trim(moeda)) |> 
  mutate(moeda = str_replace(moeda, pattern = "\\$",            
                             replacement = "USD"
                             )
         )

# Base de dados em xlsx com as moedas e suas divisas para operação de join

# caminho relativo do arquivo

tab_moedas <- readxl::read_xlsx(caminho_com_here_tab_moedas)

# juntar as tabelas moedas_receita e tab_moedas por meio da coluna moeda

moedas_orcamento_unificada<- left_join(x = moedas_orcamento,
                                       y = tab_moedas, 
                                       by = "moeda",
                                       copy = TRUE
                                       ) |> 
  distinct(moeda, divisa) |> 
  mutate(divisa = str_to_title(divisa))

# Tabela 07 - Relação de moedas na base

tab07 <- moedas_orcamento_unificada |> 
  kbl(align = "l",  
      col.names = c("Moeda",  
                    "Divisa"
                    )
    ) |> 
  kable_styling(                                                                    # define estilo da tabela.
    bootstrap_options = c("striped", 
                          "condensed"
                          ),
    font_size = 12,       
    full_width = TRUE, 
    fixed_thead = list(enabled = TRUE,
                       background = "#EDF6FD"
                       )
    ) |> 
  kable_classic_2() |>                                                              # define o tema da tabela.
  column_spec(1,                                                    
              bold = FALSE,
              width = "15cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "15cm"
              ) |> 
  footnote(general = "Relação de moedas da base. Fonte:Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 07:",
           )

# visualiza - relação de moedas da base

tab07
Moeda Divisa
USD Dólar Dos Estados Unidos
AED Dirham Dos Emirados Árabes Unidos
ALL Lek
AMD Dram Armênio
ARS Peso Argentino
ATS Schilling Austriaco
AUD Dólar Australiano
AZM Manat
BDT Taka
BEF Franco Bélga
BGL Lev Búlgaro
BND Dólar De Brunei
BRL Real
CAD Dólar Canadense
CHF Franco Suíço
CLP Peso Chileno
CNY Ren-Min-Bi, Yuan
COP Peso Colombiano
CZK Coroa Checa
DEM Marco Alemão
DKK Coroa Dinamarquesa
DOP Peso Dominicano
EEK Coroa Estoniana
EGP Libra Egípcia
ESP Peseta Espanhola
EUR Euro
FIM Marco Finlandês
FRF Franco Francês
GBP Libra Esterlina
GEL Iari
GRD Dracma Grego
HKD Dólar De Hong Kong
HRK Kuna
HUF Forint
IDR Rupiah
IEP Libra Irlandesa
ILS Shekel Israelense
INR Rupia Indiana
IRR Rial Iraniano
ISK Coroa Islandesa
ITL Lira Italiana
JMD Dólar Jamaicano
JOD Dinar Jordaniano
JPY Yen
KRW Won
LKR Rupia Do Sri Lanka
LTL Litas Da Lituânia
LVL Lats Letão
MNT Tugrik
MTL Livro Maltês
MXN Peso Mexicano
MYR Ringgit Da Malásia
NGN Naira
NLG Guilda Holandesa
NOK Coroa Norueguesa
NPR Rúpia Do Nepal
NZD Dólar Neozelandês
PHP Peso Filipino
PKR Rúpia Do Paquistão
PLN Zloty
PTE Escudo Portugues
PYG Guarani
ROL Leu Romeno
RON Leu Romeno Atual
RUR Rublo Russo
SEK Coroa Sueca
SGD Dólar De Cingapura
SIT Tolar Esloveno
SKK Coroa Eslovaca
THB Baht
TRL Lira Turca
TTD Dólar De Trinidad E Tobago
TWD Novo Dólar De Taiwan
UAH Hryvnia
VEB Bolivar Venezuelano
VND Dong
XAU Ouro
YUM Dinar Iugoslavo
ZAR Rand
Tabela 07: Relação de moedas da base. Fonte:Base de dados IMDB.


Algumas moedas como o Franco francês e o Marco alemão foram substituídas pelo Euro.


8. Maiores lucros da indústria por gêneros em toda história


Analisando a soma dos lucros dos filmes por gênero, tem-se aventura, ação e comédia os mais lucrativos. Na tabela 08, encontra-se a lista dos 10 mais rentáveis.


# separação da coluna genero para posterior pivotamento

imdb_filmes_dolares_genero <- imdb_filmes_dolares |> 
  separate(col = genero,
           into = c("genero1",
                    "genero2", 
                    "genero3"
                    ),
           sep = ","
  )

# pivotar a base de wide para long

imdb_filmes_dolares_genero <- imdb_filmes_dolares_genero |> 
  pivot_longer(
    cols = c("genero1",
             "genero2", 
             "genero3"
             ),
    names_to = "tipos_generos",
    values_to = "generos",
    values_drop_na = TRUE
  ) |> 
  mutate(generos = str_trim(generos))                 # remove os espaços em branco no início e fim da string.

# 10 gêneros com os maiores lucros

lucros_genero <- imdb_filmes_dolares_genero |>
  group_by(generos) |>
  summarise(lucro_total = sum(lucro)) |> 
  arrange(desc(lucro_total)) |> 
  slice_head(n=10) |> 
  mutate(lucro_total = paste("US$",         # formatar o valor obtido para o formato com US$ para a tabela 07.
                             format_dolar(lucro_total)      # função format_dolar() disponível no diretorio R.
                             )
         )

# Tabela 08 - Maiores lucros por gênero

tab08 <- lucros_genero |> 
  kbl(align = "l",  
      col.names = c("Gêneros",   
                    "Lucro Total"
                    )
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                # altera os estilos da tabela.
                                      "condensed"
                                      ),
                font_size = 12,  
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                                    # define o tema da tabela.
              bold = FALSE,
              width = "15cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "15cm"
              ) |> 
  footnote(general = "Maiores lucros por gênero. Fonte: Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 08:",
           )

# Visualiza a tabela - Maiores lucros por gênero

tab08
Gêneros Lucro Total
Adventure US$ 196,304,125,495.00
Action US$ 166,535,937,600.00
Comedy US$ 131,666,900,935.00
Drama US$ 115,145,661,901.00
Sci-Fi US$ 60,172,387,953.00
Animation US$ 57,828,190,358.00
Thriller US$ 53,796,761,781.00
Fantasy US$ 52,842,487,847.00
Romance US$ 38,750,284,216.00
Family US$ 38,686,084,810.00
Tabela 08: Maiores lucros por gênero. Fonte: Base de dados IMDB.


Considerando que certos gêneros produzem mais filmes que outros, pode-se encontrar os mais lucrativos por filme.


# obter as dez categorias com maiores lucros pela quantidade de filmes da categoria

lucros_genero_filme <- imdb_filmes_dolares_genero |>
  group_by(generos) |>
  summarise(lucro_total = sum(lucro)/n()) |> 
  arrange(desc(lucro_total)) |> 
  slice_head(n=10) |> 
  mutate(lucro_total = paste("US$",
                             format_dolar(lucro_total)
                             )
         )

# Tabela 09 - generos com maiores lucros por quantidade de filmes

tab09 <- lucros_genero_filme |> 
  kbl(align = "l", 
      col.names = c("Gêneros",     
                    "Lucro Total por Filme"
                    )
      ) |> 
  kable_styling(bootstrap_options = c("striped", 
                                      "condensed"
                                      ),
                font_size = 12,    
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                          # altera as configurações da tabela.
              bold = FALSE,
              width = "15cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "15cm"
              ) |> 
  footnote(general = "Lucros por gênero e quantidades de filmes. Base de dados IMDB.",
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 09:",
           )

# Visualiza a tabela - lucros por gênero e quantidade de filmes

tab09
Gêneros Lucro Total por Filme
Animation US$ 168,595,307.17
Adventure US$ 152,410,035.32
Sci-Fi US$ 120,104,566.77
Action US$ 96,374,963.89
Fantasy US$ 91,899,978.86
Family US$ 84,100,184.37
Musical US$ 49,387,833.35
Thriller US$ 47,356,304.38
Comedy US$ 46,591,260.06
Mystery US$ 39,210,738.66
Tabela 09: Lucros por gênero e quantidades de filmes. Base de dados IMDB.


A tabela 09 traz o ranking dos lucros médios dos filmes por gênero. Animação e aventura lideram a classificação neste critério.


9. Maiores notas médias por gênero


Na construção do gráfico 05, considera-se todas as categorias, independentemente da quantidade de filmes produzidos em cada gênero. Film Noir apresentou a melhor média.

Até hoje, não existe consenso sobre film Noir ser um gênero de filmes ou um estilo de filmagem.

Este gênero ou estilo se refere a filmes de longa metragem típicas dos anos 40, que combina temas policiais, criminais e são marcados pela presença de anti-heróis em ambientes urbanos.

## join de imdb e imdb_avaliacoes

imdb_join_aval <- left_join(imdb_filmes_dolares_genero,
                            imdb_avaliacoes,
                            by = "id_filme"
                            )

## separação das variáveis da coluna genero

imdb_join_aval_generos <- imdb_join_aval |> 
  separate(col = generos,
           into = c("genero_aval1",
                    "genero_aval2", 
                    "genero_aval3"
                    ),
           sep = ","
           )

# pivotamento da base para long

imdb_join_aval_generos <- imdb_join_aval_generos |> 
  pivot_longer(
    cols = c("genero_aval1", 
             "genero_aval2", 
             "genero_aval3"),
    names_to = "tipos_generos_aval",
    values_to = "generos_aval",
    values_drop_na = TRUE
  ) |> 
  mutate(generos_aval = str_trim(generos_aval))

# join de imdb_join_aval_generos e imdb_avaliacoes

imdb_medias_genero <- left_join(imdb_join_aval_generos,
                                imdb_avaliacoes
                                ) 

# descobrir as maiores notas médias por gêneros considerando o número de avaliações superiores a 10000

maiores_nota_genero <- imdb_medias_genero |> 
  group_by(generos_aval) |> 
  summarise(nota_media = mean(nota_imdb)) |> 
  arrange(desc(nota_media)) 

# gráfico 05 - notas média por genero

plot05 <- maiores_nota_genero|> 
  ggplot()+
  aes(x = fct_reorder(generos_aval,nota_media,
                      .desc = TRUE
                      ),
      y = nota_media, 
      fill = generos_aval
      ) +
  geom_point(size = 5)+
  geom_segment(aes(x = generos_aval,
                   xend = generos_aval,
                   y = 5,
                   yend =  nota_media),
               linetype = 1,
               size = 0.1
               )+
  labs(title = "Gêneros e suas médias",
       x = "Gêneros",
       y = "Médias"
       )+
  scale_y_continuous(breaks = seq(0,
                                  8.5,
                                  0.5
                                  ),
                     limits = c(5, 
                                8.5
                                ),
                     expand = expansion(add = c(0,
                                                0
                                                )
                                        )
                     ) +
  scale_x_discrete(labels = c("Film-Noir", 
                              "Documentário", 
                              "Biografia",
                              "História", 
                              "Guerra", 
                              "Western",
                              "Animação", 
                              "Drama", 
                              "Musica", 
                              "Crime",
                              "Esporte", 
                              "Musical",
                              "Aventura",
                              "Romance",
                              "Mistério", 
                              "Sci-Fi", 
                              "Suspense", 
                              "Ação", 
                              "Fantasia", 
                              "Comédia", 
                              "Família",
                              "Terror"
                              )
                   ) +
  theme(axis.text.x = element_text(angle = 45, 
                                   hjust = -0.2, 
                                   size = 7
                                   ),
        axis.text.y = element_text(size = 7),
        axis.line.x = element_line(color = "#1F1F1F"), 
        axis.line.y = element_line(color = "#1F1F1F"), 
        axis.title.x = element_text(size = 11,
                                    face = "plain"
                                    ),
        axis.title.y = element_text(size = 11, 
                                    face = "plain"
                                    ),
        plot.background = element_rect(fill = "#FFFFFF"),
        panel.background = element_rect(fill = "#FFFFFF"),
        plot.margin = unit(c(1,
                             1,
                             1, 
                             1
                             ),
                           "cm"
                           ),                                       
        plot.title = element_markdown(                                       
        size = 16,
        family = "",                                                                
        margin = unit(c(0,
                        0,
                        0.5,
                        0
                        ),
                      "cm"
                      )     
        ), 
        text = element_text(family = "",   
                            color = "#000000",
                            size = 9
                            ),  
        axis.title = element_text(size = 14,
                                  hjust = 0.5
                                  ),
      legend.position = "none"   
      )

# Visualizar o gráfico notas médias por gêneros

plot05 |> 
  ggplotly(
    tooltip = c("y",                            # mostrar no gráfico dinamicamente apenas nota média e gênero.
                "generos_aval"
                )
    )

Gráfico 05 - Notas médias por gêneros. Fonte: Base de dados IMDB.


10. Avatar

Agora, apresento as informações sobre o filme Avatar obtidas a partir da base Imdb.


10.1 - Dados do filme

Sinopse da obra: Um fuzileiro paraplégico enviado para a lua Pandora em uma missão única fica dividido entre seguir suas ordens e proteger o mundo que ele sente ser seu lar.


imdb_avatar<- imdb_filmes_dolares |> 
  filter(titulo == "Avatar") |> 
  select(titulo, data_lancamento, duracao, direcao, roteiro, producao,
         elenco, orcamento, receita, genero, lucro)

Avatar” pertence aos gêneros Action, Adventure, Fantasy. Sua premiere ocorreu em 15-01-2010, com duração de 162 minutos sob a direção James Cameron.

Contou com a participação de Sam Worthington, Zoe Saldana, Sigourney Weaver, Stephen Lang, Michelle Rodriguez, Giovanni Ribisi, Joel David Moore, CCH Pounder, Wes Studi, Laz Alonso, Dileep Rao, Matt Gerald, Sean Anthony Moran, Jason Whyte, Scott Lawrence em seu elenco.


10.2 - Direção


# tabela 10 - James Cameron

# alterar tipo de data_nascimento para date

imdb_completa_pessoas <- imdb_completa_pessoas |>    
  mutate(data_nascimento = ymd(data_nascimento)                         # conversão do tipo "chr" para "date".
  )

# Selecionar dados de James Cameron

dados_james <- imdb_completa_pessoas |> 
  filter(titulo == "Avatar") |> 
  select(titulo,
         direcao, 
         local_nascimento,
         data_nascimento
         ) |> 
  mutate(idade = year(Sys.Date())-year(data_nascimento),  # calcula a idade de James Cameron na data de hoje.
         data_nascimento = format(data_nascimento, "%d-%m-%Y")
         )

# formatar a variável idade para a tabela 10

dados_james[[5]] <- cell_spec(dados_james[[5]],
                              color = ifelse(dados_james[[5]] == 68,
                                             "#B80C09",
                                             "#3F88C5"
                                             )
                              )

# tabela 10 - dados de James Cameron

tab10 <- dados_james |> 
  kbl(align = "l",   
      col.names = c("Filme",
                    "Diretor", 
                    "Local de Nascimento",
                    "Data de Nascimento",
                    "Idade Atual"
                    ),
      full_width = TRUE,
      escape = FALSE
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # define o estilo da tabela.
                                      "condensed"
                                      ),
                html_font = "",
                font_size = 12,
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |>                                                              # define o tema da tabela.
  column_spec(1,                                                        
              bold = FALSE,
              width = "3cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "5cm"
              ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "9cm"
              ) |> 
  column_spec(4, 
              bold = FALSE,
              width = "6cm"
              ) |> 
  column_spec(5, 
              bold = FALSE,
              width = "4cm"
              ) |> 
  footnote(general = "James Cameron. Base de dados IMDB.",  
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 10:"
           )
  
# visualiza a tabela - James Cameron

tab10
Filme Diretor Local de Nascimento Data de Nascimento Idade Atual
Avatar James Cameron Kapuskasing, Ontario, Canada 16-08-1954 68
Tabela 10: James Cameron. Base de dados IMDB.


James Francis Cameron, nascido em Kapuskasing, Ontário, Canadá no dia 16 de agosto de 1954, atualmente com 68 anos é um produtor, cineasta, diretor e roteirista.

Em 2010, recebeu o prêmio de melhor diretor no Globo de Ouro com o filme Avatar. Também foi indicado para a mesma categoria no Oscar 2010 com este filme, concorrendo com Quentin Tarantino de “Bastardos Inglórios”, Lee Daniels de “Precious”, Jason Reitman de ” Up in the Air” e Kathryn Bigelow de “The Hurt Locker”. Não venceu, ficando o prêmio para Kathryn Bigelow, mas viu seu filme ser indicado em outras oito categorias, vencendo em três: melhor fotografia, melhor direção de arte e melhor efeitos visuais.


10.3 - Filmes de James Cameron na base


Além dos 7 filmes listados na base e relacionados na tabela 11, também atuou como diretor/roteirista nos filmes Piranha II: The spawning, Rambo: First Blood Part II, Strange Days, Ghosts of the Abyss e Alita: Battle Angel.

# tabela 11 - Filmes de Cameron na Base

# encontra os filmes de Cameron e cria coluna lucro com moeda US$ para a tabela 10.

filmes_cameron <- imdb_completa_pessoas |> 
  filter(direcao == "James Cameron") |> 
  mutate(data_lancamento = format(data_lancamento, "%d-%m-%Y")) |> 
  select(titulo, data_lancamento,
         genero,
         nota_imdb, 
         lucro
         ) |> 
  arrange(data_lancamento) |>                                            # cria coluna lucro para a tabela 10.
  mutate(lucro = paste("US$",
                       format_dolar(lucro)
                       )
         )                       

# Tabela 11 - Filmes de Cameron

tab11 <- filmes_cameron|>
  kbl(
    align = "l",                                               
    col.names = c("Título",                         
                  "Data de Lançamento",
                  "Gênero",
                  "Nota IMDB",
                  "lucro"
    ),
    full_width = TRUE
  ) |> 
  kable_styling(                                                                  # altera o estilo da tabela.
    bootstrap_options = c("striped", 
                          "condensed"
                          ),
    font_size = 12,
    full_width = TRUE, 
    fixed_thead = list(enabled = TRUE, 
                       background = "#EDF6FD"
                       )
    ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                                    # define o tema da tabela.
              bold = FALSE,
              width = "9cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "4.5cm"
              ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "7cm"
              ) |> 
  column_spec(4, 
              bold = FALSE,
              width = "3cm"
              ) |> 
  column_spec(5, 
              bold = FALSE,
              width = "5cm"
              ) |>
  footnote(general = "Filmes de Cameron na base. Fonte: Base de dados IMDB.",   
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 11:"
           )

# visualiza a tabela- Filmes de Cameron

tab11
Título Data de Lançamento Gênero Nota IMDB lucro
Terminator 11-01-1985 Action, Sci-Fi 8.0 US$ 72,280,331.00
True Lies 11-09-1994 Action, Comedy, Thriller 7.2 US$ 263,882,411.00
Avatar 15-01-2010 Action, Adventure, Fantasy 7.8 US$ 2,553,439,092.00
Titanic 16-01-1998 Drama, Romance 7.8 US$ 1,995,169,869.00
Terminator 2 - Il giorno del giudizio 19-12-1991 Action, Sci-Fi 8.5 US$ 418,884,847.00
The Abyss 22-12-1989 Adventure, Drama, Mystery 7.6 US$ 20,000,098.00
Aliens - Scontro finale 24-09-1986 Action, Adventure, Sci-Fi 8.3 US$ 112,884,634.00
Tabela 11: Filmes de Cameron na base. Fonte: Base de dados IMDB.


10.4 - Lucro médio dos filmes James Cameron na base


O lucro médio dos 7 filmes listados na base Imdb foi de US$ 776,648,754.57. Avatar com um ganho de US$ 112,884,634.00 e Titanic com um ganho de US$ 20,000,098.00 lideram a lista dos mais lucrativos.


10.5 - Nota média do filme Avatar e posição no ranking


# tabela 12 - Avatar ranking e nota

# criar a coluna ranking

imdb_novo <- imdb_novo |> 
  mutate(ranking = 0)

# ordena os filmes em ordem decrescente da nota e preenche a coluna ranking 

imdb_novo_ordenado <- imdb_novo |> 
  arrange(desc(nota_imdb)) |> 
  mutate(ranking = c(1: length(imdb_novo$ranking)))

### seleciona os dados do filme Avatar

imdb_tab12 <- imdb_novo_ordenado |> 
  filter(titulo == "Avatar") |> 
  mutate(total_filmes = nrow(ranking)) |> 
  select(titulo, direcao,
         nota_imdb,
         ranking) 

# configura a coluna ranking imdb para tabela 12

imdb_tab12[[4]] <- cell_spec(imdb_tab12[[4]], 
                             color = ifelse(imdb_tab12[[4]] >=2600,
                                            "#B80C09",
                                            ""
                                            )
                             )

### Tabela 12 - com dados de Avatar e sua posição no ranking

tab12 <- imdb_tab12 |> 
  kbl(align = "l",  
      col.names = c("Título",           
                    "Direção",
                    "Nota IMDB",
                    "Ranking IMDB"
      ),
      full_width = TRUE,
      escape = FALSE
  ) |> 
  kable_styling(                                                                  # altera o estilo da tabela.
    bootstrap_options = c("striped",
                          "condensed"
    ),
    font_size = 12,
    full_width = TRUE, 
    fixed_thead = list(enabled = TRUE, 
                       background = "#EDF6FD"
    )
  ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                        # altera as configurações das colunas.
              bold = FALSE,
              width = "5cm"
  ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "5cm"
  ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "5cm"
  ) |> 
  column_spec(4, 
              bold = FALSE,
              width = "5cm"
  ) |>
  footnote(general = "Avatar - ranking e nota. Fonte: Base de dados IMDB.",     
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 12:"
  )

# visualiza a tabela 11 - Avatar ranking e nota

tab12
Título Direção Nota IMDB Ranking IMDB
Avatar James Cameron 7.8 2618
Tabela 12: Avatar - ranking e nota. Fonte: Base de dados IMDB.


Entre os filmes de James Cameron, a nota de Avatar não é a mais alta entre os listados, com 7,8 é inferior às notas de Exterminador, Aliens e Exterminador 2 (vide tabela 11). Entretanto, foi o filme com a maior receita conforme o gráfico 06.


Gráfico 06 - receita - orcamento e posição imdb. Fonte: Base de dados Imdb


10.6 - Posição de Avatar no ranking dos maiores lucros


Entre todos os 85855 filmes, Avatar ocupa a primeira posição no ranking de lucros.


# tabela 13 - Avatar - ranking de lucro

# cria a coluna ranking_lucro

imdb_filmes_dolares <- imdb_filmes_dolares |> 
  mutate(ranking = 0)

# preenche a coluna ranking dos filmes de acordo com sua renda em dólares
imdb_filmes_dolares_ordenado <- imdb_filmes_dolares |> 
  arrange(desc(lucro)) |> 
  mutate(ranking_dolar = c(1: length(imdb_filmes_dolares$ranking))) |> 
  select(titulo,
         direcao,
         lucro,
         ranking_dolar
         ) 

### Tabela 13 - Avatar ranking de lucro ----

imdb_tab13<- imdb_filmes_dolares_ordenado |> 
  filter(titulo == "Avatar") |> 
  mutate(lucro = paste("US$",
                       format_dolar(lucro)                        # cria coluna lucro com US$ para a tabela12.
                       )
         )

# configura coluna ranking dolar para destaque na tabela 13

imdb_tab13[[4]] <- cell_spec(imdb_tab13[[4]],
                             color = ifelse(imdb_tab13[[4]] == 1, 
                                            "#B80C09",
                                            ""
                                            )
                             )

tab13 <- imdb_tab13 |> 
  kbl(align = "l",  
      col.names = c("Título",                   
                    "Direção",
                    "Lucro",
                    "Ranking dólar"
      ),
      full_width = TRUE,
      escape = FALSE
  ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # define o estilo da tabela.
                                      "condensed"
  ),
  font_size = 12,
  full_width = TRUE, 
  fixed_thead = list(enabled = TRUE, 
                     background = "#EDF6FD"
  )
  ) |> 
  kable_classic_2() |> 
  column_spec(1,                                                        # altera as configurações das colunas.
              bold = FALSE,
              width = "5cm"
  ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "5cm"
  ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "5cm"
  ) |> 
  column_spec(4, 
              bold = FALSE,
              width = "5cm"
  ) |>
  footnote(general = "Avatar - ranking de lucro. Fonte: Base de dados IMDB.",                         
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 13:",
  )


# visualiza tabela 13 Avatar ranking de lucro

tab13
Título Direção Lucro Ranking dólar
Avatar James Cameron US$ 2,553,439,092.00 1
Tabela 13: Avatar - ranking de lucro. Fonte: Base de dados IMDB.


10.7 - Data de lançamento


# tabela 14 - dia de lançamento

### seleciona dados do filme Avatar

imdb_tab14 <- imdb_novo_ordenado |> 
  filter(titulo == "Avatar") |> 
  mutate(data_lancamento_dia = wday(data_lancamento,
                                    week_start = getOption("lubridate.week.start",
                                                           7
                                                           ),
                                    abbr = FALSE,
                                    label = TRUE
                                    ),
         data_lancamento = format(data_lancamento, "%d-%m-%Y")             # fomrmata a data para dia-mês-ano.
         ) |>
  select(titulo, data_lancamento, data_lancamento_dia) 

### configura a coluna data_lancamento_dia para destaque na tabela 14

imdb_tab14[[3]] <- cell_spec(imdb_tab14[[3]], 
                                color = ifelse(imdb_tab14[[3]] == "sexta",
                                               "#B80C09",
                                               ""
                                               )
                                )

# Tabela 14 - Dia da semana do lançamento

tab14 <- imdb_tab14|> 
  kbl(align = "l",    
      col.names = c("Título", 
                    "Data de lançamento",
                    "Dia da semana"
                    ),
      full_width = TRUE,
      escape = FALSE
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # define o estilo da tabela.
                                      "condensed"
                                      ),
                font_size = 12,
                full_width = TRUE, 
                fixed_thead = list(enabled = TRUE,
                                   background = "#EDF6FD"
                                   )
                ) |> 
  kable_classic_2() |>                                                              # define o tema da tabela.
  column_spec(1,                                                 
              bold = FALSE,
              width = "7.5cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "7.5cm"
              ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "5cm"
              ) |>
  footnote(general = "Dia da semana do lançamento. Fonte: Base de dados IMDB.",                    
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 14:"
           )

# visualiza a tabela 14 - dia de lançamento

tab14
Título Data de lançamento Dia da semana
Avatar 15-01-2010 sexta
Tabela 14: Dia da semana do lançamento. Fonte: Base de dados IMDB.


A estreia nas salas de cinemas dos Estados Unidos ocorreu em 15-01-2010, em uma sexta-feira. Neste dia, tinha 21 anos de idade.


10.8 - Filmes lançados no mesmo dia


Na tabela 15, listo todos os filmes lançados no dia 15 de janeiro de 2010, data de lançamento de Avatar.


# tabela 15 - filmes lançados no mesmo dia

tab15 <- imdb_novo_ordenado |> 
  filter(data_lancamento == "2010-01-15") |> 
  mutate(data_lancamento = format(data_lancamento, "%d-%m-%Y")) |>          # formata data para o dia-mês-ano.
  select(titulo,
         data_lancamento,
         genero,
         nota_imdb,
         pais
         ) |>
  kbl(align = "l",  
      col.names = c("Título",
                    "Data de Lançamento",
                    "Gênero",
                    "Nota IMDB",
                    "País"
                    ),
      full_width = TRUE
      ) |> 
  kable_styling(bootstrap_options = c("striped",                                  # define o estilo da tabela.
                                      "condensed"
                                      ),
    font_size = 12,
    full_width = TRUE, 
    fixed_thead = list(enabled = TRUE, 
                       background = "#EDF6FD"
                       )
    ) |> 
  kable_classic_2() |>                                                               #define o tema da tabela.
  column_spec(1,                                                
              bold = FALSE,
              width = "5cm"
              ) |>      
  column_spec(2, 
              bold = FALSE,
              width = "5cm"
              ) |> 
  column_spec(3, 
              bold = FALSE,
              width = "5cm"
              ) |> 
  column_spec(4, 
              bold = FALSE,
              width = "3cm"
              ) |>
  column_spec(5, 
              bold = FALSE,
              width = "5cm"
              ) |>
  footnote(general = "Filmes lançados no mesmo dia. Fonte:Base de dados IMDB.",           
           footnote_as_chunk = TRUE,
           fixed_small_size = TRUE,
           general_title = "Tabela 15:",
           )
# visualiza a tabela - filmes lançados no mesmo dia

tab15
Título Data de Lançamento Gênero Nota IMDB País
Avatar 15-01-2010 Action, Adventure, Fantasy 7.8 USA
A Single Man 15-01-2010 Drama, Romance 7.6 USA
La prima cosa bella 15-01-2010 Comedy, Drama 7.1 Italy
Rudolfa mantojums 15-01-2010 Comedy, Drama 7.0 Latvia
Shikshanachya Aaicha Gho 15-01-2010 Comedy 6.9 India
Havukka-ahon ajattelija 15-01-2010 Comedy, Drama 6.8 Finland
Tutto ciò che amo 15-01-2010 Comedy, Drama, Music 6.8 Poland
Snabba cash 15-01-2010 Action, Crime, Drama 6.7 Sweden, Germany, Denmark, France
Chance 15-01-2010 Comedy, Drama 6.6 Panama, Colombia
Harmony and Me 15-01-2010 Comedy 6.2 USA
Hello Hum Lallann Bol Rahe Hain 15-01-2010 Comedy, Drama 6.2 India
44 Inch Chest 15-01-2010 Crime, Drama 5.8 UK
Hierro 15-01-2010 Mystery, Thriller 5.7 Spain
Operazione spy sitter 15-01-2010 Action, Comedy, Family 5.4 USA
Kaptan feza 15-01-2010 Action 5.2 Turkey
Bolo Na Tumi Amar 15-01-2010 Romance 5.1 India
Gelecekten Bir Gün 15-01-2010 Comedy, Drama 5.0 Turkey
Chance Pe Dance 15-01-2010 Comedy, Drama, Music 4.7 India
Porkchop 15-01-2010 Horror 4.4 USA
Detention 15-01-2010 Horror, Thriller 3.0 USA
Zombie Undead 15-01-2010 Horror 2.3 UK
Tabela 15: Filmes lançados no mesmo dia. Fonte:Base de dados IMDB.


10.8 - Distribuição de notas de Avatar por intervalo de classes de idade


Pode-se observar no gráfico 07 que as notas por faixa etária variaram pouco. A menor nota de 7.5 para o intervalo de 0 a 18 anos e a maior nota de 7.9 para a classe de pessoas com mais de 45 anos.


# Gráfico distribuição da nota do filme avatar por idade

# renomear as colunas

imdb_avaliacoes <- imdb_avaliacoes |> 
  rename("[00-18)" = "nota_media_idade_0_18",
         "[18-30)" = "nota_media_idade_18_30",
         "[30-45)" = "nota_media_idade_30_45",
         "[45-ou mais)" = "nota_media_idade_45_mais")

# join das base imdb e imdb_avaliações

imdb_join_avatar_idades <- left_join(imdb_novo, imdb_avaliacoes, by = "id_filme") |> 
  filter(titulo == "Avatar") |>
  pivot_longer("faixas_etarias",
               values_to = "nota_media_idade", 
               cols =c("[00-18)",
                       "[18-30)",
                       "[30-45)",
                       "[45-ou mais)"
                       )
               ) |> 
  group_by(faixas_etarias) |> 
  summarise(nota_media_idade)

# cria paleta de cores para o gráfico

cor <- c("#c42847", 
         "#ffad05", 
         "#7d5ba6", 
         "#00bbf9"
         )

# gráfico 06 - notas por faixa etária

plot07 <- imdb_join_avatar_idades |> 
  ggplot(aes(x=faixas_etarias, 
             y = nota_media_idade, 
             label = nota_media_idade
             )
         )+
  geom_col(width = 0.5,
           fill = cor,
           alpha = 0.9
           )+
  geom_label(nudge_y = 0.5)+
  labs(title = "Distribuição das Notas por Idade",
       subtitle = "Notas médias por intervalo de classes do filme Avatar",
       x = "Idade",
       y = "Nota Média")+
  theme_classic()+
  theme_imdb() +
  scale_y_continuous(expand =expansion(add = c(0,
                                               0.5)
                                       ),
                     labels = scales::number_format(accuracy = 0.1,
                                                    decimal.mark = ","
                                                    )
                     )

# visualiza o grafico notas por faixa etária

plot07
Gráfico 07 - Notas por faixa etária. Fonte: Base de dados Imdb

Gráfico 07 - Notas por faixa etária. Fonte: Base de dados Imdb


Conclusão


Explorei os recursos do tidyverse e demais ferramentas da linguagem R abordados no curso e extrai informações interessantes e curiosidades sobre artistas, quantidade de filmes, valores de receitas, gastos e lucros que a indústria cinematográfica movimenta e particularidades sobre os gêneros dos filmes.

Na seção 10, trouxe informações sobre o meu filme preferido, Avatar.

A base permite a descoberta de muitas outras informações além das que apresentei neste trabalho e se constitui em uma excelente fonte para pesquisas sobre filmes e séries.

Aos amantes do cinema, segue o link do trailer de Avatar: O Caminho das Águas.


Anexos


Dicionários

1. Dicionário da base Imdb


Variável Tipo Descrição
id_filme chr identificador alfanumérico exclusivo do título
titulo chr nome da obra em materiais promocionais na data do lançamento
titulo_original chr nome original da obra, no idioma original
ano dbl ano da produção
data_lancamento chr data do lançamento do filme ou a data de início da série
genero chr inclui até três gêneros associados ao título
duracao dbl tempo de execução em minutos
pais chr país
idioma chr idioma
orcamento chr orçamento
receita chr receita
receita_eua chr receita nos EUA
nota_imdb dbl nota média obtida pela obra nas avaliações dos usuários
num_avaliacoes dbl total de avaliações realizadas para cada título
direcao chr diretor(es)
roteiro chr roteirista(s)
producao chr empresa produtora
elenco chr nomes dos integrantes do elenco
descricao chr sinopse da obra
num_criticas_publico dbl total de críticas recebidas do público
num_criticas_critica dbl total de críticas recebidas dos críticos


2. Dicionário da base Imdb_pessoas


Variável Tipo Descrição
pessoa_id chr identificador alfanumérico exclusivo da pessoa
nome chr nome artístico ou abreviado do ator, diretor ou roteirista
nome_nascimento chr nome completo
altura dbl altura em cm
bio chr biografia
data_nascimento chr data de nascimento
local_nascimento chr local de nascimento
data_falecimento date data de falecimento
local_falecimento chr local de falecimento
razao_falecimento chr motivo ou causa do falecimento
nome_conjuges chr nome(s) do cônjuge(s)
num_conjuges dbl número de cônjuges
num_divorcios dbl total de divórcios
num_filhos dbl total de filhos
num_conjuges_com_filhos dbl total de cônjuges com filhos


3. Dicionário da base Imdb_avaliacao


Variável Tipo Descrição
id_filme chr identificador alfanumérico exclusivo do título
num_avaliacoes dbl total de avaliações
nota_media dbl média da variável nota
nota_mediana dbl mediana da variável nota
nota_media_idade_0_18 dbl média da variável nota entre os avaliadores de 0 a 18 anos
num_votos_idade_0_18 dbl número de votos dos avaliadores de 0 a 18 anos
nota_media_idade_18_30 dbl média da variável nota entre os avaliadores de 18 a 30 anos
num_votos_idade_18_30 dbl número de votos dos avaliadores de 18 a 30 anos
nota_media_idade_30_45 dbl média da variável nota entre os avaliadores de 30 a 45 anos
num_votos_idade_30_45 dbl número de votos dos avaliadores de 30 a 45 anos
nota_media_45_mais dbl média da variável nota entre os avaliadores de 30 a 45 anos
num_votos_idade_45_mais dbl número de votos dos avaliadores de 45 ou mais anos
nota_media_ dbl nota média obtida pela obra nas avaliações dos usuários
nota_media_top_1000_avaliadores dbl nota média dos top 1000 avaliadores
num_votos_top_1000_avaliadores dbl número de votos dos top 1000 avaliadores
nota_media_eua dbl média da variável nota nos EUA
num_votos_eua dbl número de votos nos EUA
nota_media_fora_eua dbl média da variável nota fora dos EUA
num_votos_fora_eua dbl número de votos fora dos EUA